#import "@preview/touying:0.6.1": *
#import themes.aqua: *
#import "@preview/pinit:0.2.2": *

#show: aqua-theme.with(
  aspect-ratio: "16-9",
  config-info(
    title: [概率论],
    subtitle: [Subtitle],
    author: [数学主义],
    date: datetime.today(),
    institution: [Institution],
  ),
)
#set text(font: ("Calibri", "Microsoft YaHei"), weight: "regular", size: 25pt)

#title-slide()

// #outline-slide()

= 随机变量及其分布

== 随机变量的定义
---
- 设$Omega$是集合(样本空间)，而$cal(F)$是$Omega$上的一个$sigma$代数。那么$\( Omega \, cal(F) \)$就叫做一个*可测空间*(measurable space)，而$cal(F)$中每一个元素就叫做一个*可测集*(measurable
  set)。

- 如无特别说明，我们总假设实数集$bb(R)$装备Borel
  $sigma$代数，它是使所有区间可测的最小的$sigma$代数，它的元素叫做Borel可测集，但对于$bb(R)$我们将会直接把这类子集叫做可测集。

- 两个可测空间之间的映射，如果保证可测集的原象都是可测集，就称为*可测映射*(measurable
  mapping)。

- 设$\( Omega \, cal(F) \)$是可测空间，那么任何可测映射$X : Omega arrow.r bb(R)$都称为*随机变量*(random
  variable)。

- 如果$X \( Omega \)$是至多可列集, 就说$X$是#strong[离散]随机变量.

- 如果$X \( Omega \)$是一个区间, 就说$X$是#strong[连续]随机变量.

== 分布函数的定义
设$\( Omega \, cal(F) \, P \)$是概率空间，而$X : Omega arrow.r bb(R)$是随机变量，则称函数
$ F : bb(R) arrow.r \[ 0 \, 1 \] \, quad x mapsto P \( X lt.eq x \) $
为$X$的*分布函数*(cumulative distribution function，缩写为CDF)，
其中$P \( X lt.eq x \)$是$P \( { s in Omega : X \( s \) lt.eq x } \)$的简写。

此时称 $X$ 服从 $F \( x \)$，记为 $X tilde.op F \( x \)$。

== Mathlib4中对应的定义
<mathlib4中对应的定义>
参见
#link("https://leanprover-community.github.io/mathlib4_docs/Mathlib/Probability/CDF.html")

```lean
/-- Cumulative distribution function of a real measure. The definition currently makes sense only
for probability measures. In that case, it satisfies `cdf μ x = μ.real (Iic x)` (see
`ProbabilityTheory.cdf_eq_real`). -/
noncomputable
def cdf (μ : Measure ℝ) : StieltjesFunction :=
  condCDF ((dirac Unit.unit).prod μ) Unit.unit
```

机翻:

```
/-- 实测度的分布函数。目前该定义仅对概率测度有意义。在此情况下，它满足 `分布函数 μ x = μ.实值 (Iic x)`（参见 `ProbabilityTheory.cdf_eq_real`）。-/
不可计算的
定义 分布函数 (μ : 测度 ℝ) : Stieltjes函数 :=
  条件分布函数 ((单点测度 单元.单元).乘积 μ) 单元.单元
```

== 分布函数的性质
<分布函数的性质>
随机变量$X$的分布函数$F \( x \) = P \( X lt.eq x \)$有三个基本性质:

+ 单调递增.

+ 有界: 恒有$0 lt.eq F \( x \) lt.eq 1$, 并且
  $ lim_(x arrow.r - oo) F \( x \) = 0 \, quad lim_(x arrow.r + oo) F \( x \) = 1 . $

+ 右连续: 对任意$x_0 in bb(R)$都有
  $ lim_(x arrow.r x_0 + 0) F \( x \) = F \( x_0 \) . $

== 分布列
设$X : \( Omega \, cal(F) \, P \) arrow.r bb(R)$是离散随机变量，并且$X$的像为
$ X \( Omega \) = { x_i : i = 1 \, 2 \, dots.h \, n \, dots.h } \, $
则称数列
$ p_i := p \( x_i \) := P \( X = x_i \) \, quad i = 1 \, 2 \, dots.h \, n \, dots.h $
为$X$的*分布列*(probability
distribution)，记为$X tilde.op { p_i }$。

== 求离散随机变量的分布列应注意
<求离散随机变量的分布列应注意>
(1) 确定随机变量的所有可能取值;

(2) 计算每个取值点的概率.

== 对离散随机变量的分布函数应注意
<对离散随机变量的分布函数应注意>
(1) F(x)是递增的阶梯函数;

(2) 其间断点均为右连续的;

(3) 其间断点即为X的可能取值点;

(4) 其间断点的跳跃高度是对应的概率值.

== 三门问题
#block[
#figure(
  align(center)[#table(
    columns: 4,
    align: (left,left,left,left,),
    table.header([#strong[概率统计]], [#strong[现实世界]], [#strong[数学模型]], [#strong[测度论]],),
    table.hline(),
    [样本空间], [三扇门], [$Omega = { 1 \, 2 \, 3 }$], [集合$Omega$],
    [随机变量], [门后是汽车或山羊，恰有一扇门的后面是汽车], [$X : Omega arrow.r bb(R)$，像为${ 0 \, 1 }$，约定$0$表示山羊，$1$表示汽车，那么恰有一个$i in Omega$满足$X \( i \) = 1$], [一个可测函数$X : Omega arrow.r bb(R)$],
  )]
  , kind: table
  )

]
#block[
#figure(
  align(center)[#table(
    columns: 4,
    align: (left,left,left,left,),
    table.header([#strong[概率统计]], [#strong[现实世界]], [#strong[数学模型]], [#strong[测度论]],),
    table.hline(),
    [离散随机变量], [因为门后奖品的类型有限], [因为$X$的像是${ 0 \, 1 }$], [$X$的像是至多可数集],
    [离散随机变量的分布列], [每扇门的后面是汽车的概率是$1 \/ 3$], [$p_i = 1 \/ 3$，其中$i = 1 \, 2 \, 3$ （不对！）], [一个数列],
    [离散随机变量的分布函数], [], [$F \( x \) = sum_(X \( i \) lt.eq x) p_i = sum_(X \( i \) lt.eq x) 1 / 3$ (不对！)], [数列的部分和],
  )]
  , kind: table
  )

]
== 密度函数
如果连续随机变量$X$的分布函数是$F$，而且存在非负可积函数$p : bb(R) arrow.r bb(R)$使得对任意$x in bb(R)$都有
$ F \( x \) = integral_(- oo)^x p \( t \) d t \, $ 我们就说 $p$ 是 $X$
的*密度函数*(probability density function).

== 注意点
<注意点>
+ $P \( a lt.eq X lt.eq b \) = integral_a^b p \( x \) d x$.

+ $F \( x \)$ 是 $\( - oo \, + oo \)$ 上的连续函数;

+ $P \( X = x \) = F \( x \) - F \( x - 0 \) = 0$\;

+ $ P { a < X lt.eq b } & = P { a < X < b }\
   & = P { a lt.eq X < b }\
   & = P { a lt.eq X lt.eq b }\
   & = F \( b \) - F \( a \) . $

+ 当$F \( x \)$ 在$x$点可导时, $p \( x \) = F' \( x \)$ \;

+ 当$F \( x \)$ 在$x$点不可导时, 可令$p \( x \) = 0$.

== 小结
#block[
#figure(
  align(center)[#table(
    columns: 2,
    align: (left,left,),
    table.header([#strong[现实世界(概率统计)]], [#strong[数学模型(测度论)]],),
    table.hline(),
    [样本空间], [集合$Omega$],
    [随机变量], [一个可测函数$X : Omega arrow.r bb(R)$],
    [随机变量的分布函数], [子集$X^(- 1) \( \( - oo \, x \] \)$的测度],
    [离散随机变量], [$X$的像是至多可数集],
    [离散随机变量的分布列], [一个数列],
    [离散随机变量的分布函数], [数列的部分和],
    [连续随机变量], [$X$的像是不可数集，通常是区间],
    [连续随机变量的密度], [一个可积函数],
    [连续随机变量的分布函数], [可积函数的积分],
  )]
  , kind: table
  )

]
== 比较
#block[
#figure(
  align(center)[#table(
    columns: 2,
    align: (left,left,),
    table.header(table.cell(align: center)[#strong[离散型]], table.cell(align: center)[#strong[连续型]],),
    table.hline(),
    [分布列$p(x_n)=P(X=x_n)$唯一], [密度函数$X tilde p(x)$不唯一],
    [$ F \( x \) = sum_(x_i lt.eq x) P \( X = x_i \) $], [
    $ F \( x \) = integral_(- oo)^x p \( t \) d t $],
    table.cell(align: center, colspan: 2)[
    $ F \( a + 0 \) = F \( a \) $],
    table.cell(align: center, colspan: 2)[
    $ P \( a < X lt.eq b \) = F \( b \) - F \( a \) $],
    [点点计较], [$P \( X = a \) = 0$],
    [$F \( x \)$为阶梯函数], [$F \( x \)$为连续函数],
    [$F \( a - 0 \) eq.not F \( a \)$], [$F \( a - 0 \) = F \( a \)$],
  )]
  , kind: table
  )

]
== 课堂练习
设 $X tilde.op p \( x \)$，且 $p \( - x \) = p \( x \)$，$F \( x \)$ 是
$X$ 的分布函数，则对任意实数 $a > 0$，有( )

+ $F \( - a \) = 1 - integral_0^a p \( x \) d x$

+ $F \( - a \) = 1 / 2 - integral_0^a p \( x \) d x$

+ $F \( - a \) = F \( a \)$

+ $F \( - a \) = 2 F \( a \) - 1$
